Quantification et identification des concepts implicites d'une requête

نویسندگان

  • Romain Deveaud
  • Ludovic Bonnefoy
  • Patrice Bellot
چکیده

In this paper we introduce an unsupervised method for mining and modeling latent search concepts. We use Latent Dirichlet Allocation (LDA), a generative probabilistic topic model, to exhibit highly-specific query-related topics from pseudo-relevant feedback documents. Our approach automatically estimates the number of latent concepts as well as the needed amount of feedback documents, without any prior training step. Latent concepts are then weighted to reflect their relative adequacy and are further used to automatically reformulate the initial user query. We also explore the use of different types of sources of information for modeling the latent concepts. For this purpose, we use four general sources of information of various nature (web, news, encyclopedic) from which the feedback documents are extracted. We evaluate our approach over two large ad-hoc TREC collections, and results show that it significantly improves document retrieval effectiveness while best results are achieved by combining latent concepts modeled from all available sources. MOTS-CLÉS : Recherche contextuelle, modélisation thématique, retour de pertinence

برای دانلود رایگان متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Accurate and effective latent concept modeling for ad hoc information retrieval

A keyword query is the representation of the information need of a user, and is the result of a complex cognitive process which often results in under-specification. We propose an unsupervised method namely Latent Concept Modeling (LCM) for mining and modeling latent search concepts in order to recreate the conceptual view of the original information need. We use Latent Dirichlet Allocation (LD...

متن کامل

Interrogation flexible et coopérative d'une BD par abstraction conceptuelle hiérarchique

RÉSUMÉ. L' interrogation des bases de données (BD) nécessite une connaissance précise et détaillée des données et de leur organisation. L’interrogation flexible tente de rendre l’interrogation classiques des BD plus souple pour les utilisateurs. Plusieurs approches d’interrogation flexible ont été proposées dans la littérature. Nous proposons, dans ce papier, une approche flexible et coopérativ...

متن کامل

Construction automatique d'ontologies à partir d'une base de données relationnelles : application au médicament dans le domaine de la pharmacovigilance

Résumé : Afin de construire une ontologie des médicaments en OWL dans le cadre d’un projet sur la pharmacovigilance, nous envisageons la possibilité de réutiliser les connaissances contenues dans une base de données. L’étude des outils permettant cette transition montre qu’ils ne sont pas entièrement satisfaisants. En effet, ils ne considèrent pas chaque enregistrement comme étant un concept et...

متن کامل

Traitement d'attributs inter-dépendants pour la recherche d'information par treillis

HAL is a multidisciplinary open access archive for the deposit and dissemination of scientific research documents, whether they are published or not. The documents may come from teaching and research institutions in France or abroad, or from public or private research centers. L'archive ouverte pluridisciplinaire HAL, est destinée au dépôt età la diffusion de documents scientifiques de niveau r...

متن کامل

Interrogation à base d'Annotation Sémantique

Résumé. Les approches de la recherche d’information (RI) actuelles ne saisissent pas formellement la signification explicite d'une requête à base de mots-clés mais fournissent une voie confortable pour l'utilisateur qui spécifie ces besoins en informations sur la base des mots-clés. La recherche sémantique promet de fournir des résultats plus précis que la traditionnelle recherche par mots-clés...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

عنوان ژورنال:

دوره   شماره 

صفحات  -

تاریخ انتشار 2013